查看原文
其他

科研速递 | 理工学院吴辰晔教授团队自然子刊Scientific Reports上基于自纠正的因果学习挖掘人类偏好


近日,香港中文大学(深圳)理工学院的吴辰晔教授团队在《Scientific Reports》发表题为“Mining human preference via self-correction causal structure learning”的文章。


下载链接:

https://rdcu.be/cJE3D



01

  期刊介绍  


Scientific Reports 是一本开放获取期刊,发表来自自然科学、心理学、医学和工程学各个领域的原创研究。Scientific Reports是全球被引用次数排名第 6 的期刊,是JCR Q1期刊,2020 年被引用次数超过 540,000 次,在政策文件和媒体中受到广泛关注。



02

  研究背景  


由于因果结构学习(CSL)具有强大的揭示因果联系的能力,学界已经进行了大量研究工作试图增强因果结构学习算法在各种人工智能应用中的可扩展性。然而,因果结构学习算法的稳定性和可解释性方面所吸引的注意力较少。因此,这项工作提出了一种自我校正机制,该机制为因果结构学习嵌入领域知识,通过保证有意义的输出,即使在低维但高噪声的环境中也能提高稳定性和准确性。所提出的算法在合成数据集和真实数据集上,对多个经典且有影响的因果结构学习算法提出了挑战。我们的算法不仅在合成数据集上实现了卓越的准确性,在真实数据集上,我们的方法可将学习到的因果结构解释为人类对投资的偏好,所得结论与领域专家的分析相吻合。



03

  研究内容  


探索人类偏好在许多领域都发挥着重要作用。例如,探索就业偏好会影响人力资本投资;探索投资偏好促进金融和资本市场,从而惠及整个经济。通常,探索偏好是一项微妙的任务,因为它本质上是异质的,并且会受到每个人周围环境的影响。Covid-19 带来了进行探索的绝好机会,因为疫情的全球大流行在短时间内彻底改变了人们的生活方式和偏好。投资偏好的变化可以通过疫情前后主要金融产品的价格波动传播链不同来推断:不同的偏好导致不同的价格波动传播链,从而揭示了原因——影响价格之间的联系。这一点我们可以通过图一中主要金融衍生品价格波动管中窥豹:


图1展示了归一化后的股票指数、美债收益率和黄金价格。图1.a显示美债收益率和黄金价格往往与股票指数呈负相关关系,然而在 Covid-19 爆发后不久(图1.b),尽管美债仍然呈现负相关关系,但黄金价格却呈现正相关关系。尽管这类观察可能还不够深入,无法直接揭示投资偏好如何变化,但它说明了 Covid-19 前后,投资偏好发生了变化。

图1


因果结构学习(CSL)是因果推理的主流框架之一,天生可作为挖掘偏好的工具。它旨在从数据反向推断数据中呈现的因果结构,该因果结构用有向无环图来表示,其中有向箭头表示因果关系连接。例如,下雨和打开洒水器都会使草地变湿,而下雨(天气状况)和打开洒水器(人类活动)之间没有因果关系。假设一个数据集包含三维布尔变量:一年中每一天的下雨与否(Rain)、洒水器打开与否(Sprinkler)和草地潮湿与否(Wet)。CSL 可以推断出像“雨→湿←洒水器”这样的有向无环图。


但传统的CSL算法有两大问题,一是其输出的结构可能与领域常识相矛盾,二是其输出的结构可能自行矛盾。这两点问题可以通过图2显示出来:

图2


通过pc.stable算法与mmhc算法得到的结构图显示,美国每日新增确诊人数(Covid节点)对于金融市场没有任何影响,这一论点无法解释金融市场的现象。而h2pc算法、tabu算法与hc算法输出的结构认为,金融市场会影响美国每日新增确诊人数,这显然与我们的常识相违背。更进一步,f图展示了这些经典算法运行过程中产生的双向边现象(即同一数据集中既存在数据支持“A导致B”这一论点,同时存在数据支持“B导致A”这一论点)的次数,说明了这些算法运行中存在着自相矛盾的现象。


我们通过分析算法出现矛盾现象的原因,对症下药设计了如图3所示的自纠正机制,提出了RPC*算法,既提高了因果结构学习在低维高噪环境下的稳定性,又保证了算法输出的合理性、可解释性。我们从RPC*在合成数据集与真实数据集上的表现,这两个不同的维度展现了RPC*的有效性。

图3


对于合成数据集,由于生成该数据集的因果图是已知的,可以通过算法输出的结构图与原结构图的差距(即因果关系学习效果的误差之和)来衡量算法表现,这种指标名为MASHD。该指标越低,说明算法预测的因果关系越准。RPC*算法与其他经典算法在各类合成数据集上的表现效果如图4所示。该合成数据集簇包含30个数据集,5种不同的结构,每种结构有两种不同的噪声类型(高斯分布与均匀分布),每种噪声方差有3档(高噪声、中等噪声、低噪声)。RPC*算法跟十种对比算法相比,在这30个数据集上均实现了最低MASHD,卓越率达到100%。

图4


在真实数据集上,由于真实因果图为止,MASHD指标不再适用,可采用的指标为MAKL-d,该指标是真实数据与由算法输出因果图拟合的数据之间的KL-divergence的负值,该数值越大,表示算法效果越好。

图5

图5.a展示了RPC*与其他对比算法在真实数据集上的MAKL-d。而且不仅仅是量化的指标,RPC*发现的因果结构中,其中因果关系所蕴含的经济学、心理学原理也与其他众多相关专家的结论不谋而合,如在疫情爆发前,唯一的来源是十年期国债,表明其在投资中的高度优先性。除了十年期国债,美元是第二优先。这两个事实都表明投资者对美国经济充满信心。然后价格波动传播到短期国债,石油/股票,这与美元价值变化将影响股票指数的事实相吻合,因为购买股票需要美元。最后,黄金作为避风港,因为黄金的价值在于保值而非投资。总体而言,这条链条(即投资偏好)显示出投资者对经济的积极态度。但是,疫情改变了这种投资态度和价格波动传播链。在Covid-19爆发后,直接受影响的产品是国债,这与Covid-19增加了债券的粘合性的说法是一致的。而无论是在疫情之前还是之后,国债都是价格波动传播链的源头,支撑着它们作为全球资产价格锚的作用。然后收益率波动传递给黄金价格而不是美元/股票。也就是说,在疫情爆发后,投资考虑先投资黄金,再投资美元/股票,这与疫情前正好相反。同样的情况也发生在欧元区,这类现象有个传统术语,称之为避险现象指的是将金融代理人从风险更高的资产转移到更安全的投资级细分市场。这一观察表明,由于投资者对经济的消极态度,投资潜意识发生了显着变化。Gallup Wednesday发布的一项民意调查也支持这种潜意识的变化,该民意调查显示67%的美国人认为该国的经济状况正在恶化。同样,印度储备银行的研究人员也发表了同样的声明。



04

  主要贡献  


我们通过设计了基于自纠正机制的RPC*算法,克服了传统的CSL算法的两大问题:一是其输出的结构可能与领域常识相矛盾,二是其输出的结构可能自行矛盾。既提高了因果结构学习在低维高噪环境下的稳定性,又保证了算法输出的合理性、可解释性。RPC*算法在合成数据集表现了超高的准确性,同时其通过真实数据集挖掘出的因果结构解释了人类投资偏好在Covid-19爆发前后的变化,与众多专家的研究结论不谋而合,这些都说明了RPC*算法在挖掘人类偏好上的优越性能。



05

  作者简介  


本文共同通讯作者为香港中文大学(深圳)助理教授吴辰晔(另一位共同通讯作者为百度的彭卫华博士)。

吴辰晔,香港中文大学(深圳)理工学院助理教授,校长青年学者。吴教授分别于2009年,2013年在清华大学电子工程系、清华大学交叉信息研究院获得学士学位与博士学位(师从图灵奖得主姚期智院士)。吴教授主要从事电力市场设计、电网安全及风险评估、电力系统控制等研究,特别专注于新型电力市场商业模式设计、电力市场中市场力分析、人工智能与数据驱动技术在电力系统控制与优化的研究。目前,吴教授已发表高水平期刊/国际顶级会议论文(如IEEE Transactions on Power Systems, IEEE Transactions on Smart Grid, IEEE Transactions on Sustainable Energy, ACM e-Energy等)70余篇,是中国工业与应用数学学会金融科技与算法专委会委员,中国计算机学会计算经济专业组执行委员,自2022年2月起担任IEEE系统科学汇刊(IEEE Systems Journal)编委(Editorial Board Member, Associate Editor),2022年IEEE智能电网通讯会议(IEEE SmartGridComm)数据与计算分会共同主席,2022年ACM未来能源大会(ACM e-Energy)数字会议共同主席,先后三次获得能源领域旗舰会议的最佳论文奖(包括2012年IEEE SmartGridComm最佳论文奖,2013年和2020年IEEE PES General Meeting最佳论文奖)。

本文第一作者:清华大学博士生孙健

孙健是清华大学交叉信息研究院的博士生,师从吴辰晔教授。本科毕业于北京航空航天大学数学与系统科学学院,获得数学与应用数学学士学位。2016年获得国家奖学金,2019年获得清华大学交叉信息研究院研究生奖学金。她的主要研究方向包括电力系统中的市场设计和优化控制问题。




点击以下链接,进入理工时刻:

报名通知 | 香港中文大学(深圳)理工学院2022年全国优秀大学生夏令营

活动预告 | 第五届聚集诱导发光国际研讨会

联培项目 | 香港中文大学(深圳)通信工程硕士—华为技术有限公司联合培养项目

SSE WEEKLY COLLOQUIUM活动回顾 | 2022理工学院系列研讨会第十八讲

SSE Newsletter | 理工学院2022年第一季度简报

喜讯 | 港中大(深圳)唐本忠教授被评为排名中国第一的化学家及中国第五的材料科学家

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存